データウェアハウス(DWH)とデータマネジメント
こんにちは、DI部(データインテグレーション部)の川崎です。
昨年、JDMC(日本データマネジメント・コンソーシアム)というグループの活動に参加させていただいたのですが、青木さんの書籍(第2部は、DWH構築の話)やスライドを拝見していると、データマネジメントに取り組むことで解決できそうな課題も散見されました。
「10年戦えるデータ分析入門」青木峰郎 著 http://www.sbcr.jp/products/4797376272.html
1.1 現実的な分析の方法とは
- 分析、データ活用という単語は大流行。
- しかし、いざ分析をしようとすると大変。
- まともに分析を始められない、始めても完了できない。
- これは、特定の企業によらず構造的に発生する問題であり、乗り越えるべき壁。
- 壁を乗り越えるには、分析をしたい人とシステムを作っている人が同じ方向を向く必要がある。
■ 柔軟な作業を可能にするサンドボックス (11.3)
- ヘビーユーザーには書き込み可能な専用領域を割り当てることを検討すべき。
- このような、書き込み可能で特定ユーザー専用の領域のことをサンドボックス(sandbox)と呼ぶ。
- 優秀な分析者にサンドボックスを割り当てると、分析を圧倒的に効率化できる。
- また、書き込みを可能にすることで、新しい共通ビューや参照テーブルがそこから生まれてくる土壌を作ることもできる。
これらの課題は、データマネジメントの問題でもある、と認識しています。
DWHをどう作るか→「がんばる」しかない、というのはある意味真実ではありますが、データマネジメントの方法論で解決できる部分もありますし、その方法論によって担当者の負担を軽減することができます。
JDMCには、データマネジメントのノウハウを持つメンバーが多数在籍し、情報共有を進める活動をしておりますので、特に事業会社に在籍されていて、データマネジメントにご興味のある方は、JDMCへの入会をお勧めします!まずは8/4(木)の定例セミナーに参加されてはいかがでしょうか?
【JDMC】第34回 JDMC定例セミナーのご紹介 https://dev.classmethod.jp/etc/about-jdmc-06/
青木さんの「10年戦えるデータ分析入門」の「14章 本書を読み終えた後に」では、「データモデリング」の書籍として、下記の書籍が紹介されていますが、著者の真野さんもJDMCのメンバーでいらっしゃいます。
真野正「実践的データモデリング入門」翔泳社、2003 https://www.amazon.co.jp/dp/4798103853
【本ブログの参考資料】 【JDMC】「データマネジメント概説書」「データマネジメント・ケーススタディ」のご紹介 https://dev.classmethod.jp/etc/about-jdmc-02/
【JDMC】「データマネジメント・ケーススタディ トップダウン編」のご紹介 https://dev.classmethod.jp/etc/about-jdmc-04/
【参考資料(他ブログ)】 ◇クックパッド開発者ブログ 巨大なバッチを分割して構成する 〜SQLバッチフレームワークBricolage〜 http://techlife.cookpad.com/entry/2015/06/27/154407
ディレクターがSQLを使えてよかった話 http://techlife.cookpad.com/entry/2016/07/06/094332
◇once upon a time, データを一箇所に集めることでデータ活用の民主化が進んだ話 http://chezou.hatenablog.com/entry/2016/05/05/222046
◇Qiita マーケティング担当者にSQLを完全マスターさせた話 http://qiita.com/uraura/items/8020989e79a6985b0c29
最後に
こちらのエントリで、クックパッド青木さんの講演ビデオのご紹介をしておりますので、よろしければご覧ください。
データウェアハウス再入門(講演ビデオのご紹介) https://dev.classmethod.jp/server-side/db/data-warehouse-basics-03/